控制论登场,解决了合成生物学面临的一大难题
前言:细胞生长的内部环境是动态变化的,这使得构建基因线路或者网络时,在细胞机器中引入的元件难以实现稳定的输出,如众所熟知的启动子。近期在Nature Biotechnology发表的一篇文章,来自MIT的合成生物学著名学者Christopher Voigt实验室的研究人员运用控制论理论设计了能够在任何拷贝数下实现目的基因同一水平表达的启动子元件。理论证明,如果负反馈(Negative regulation)处于完美的非协同状态(non-cooperative),那么目的基因实现对拷贝数的非依赖性可以通过非一致前馈环(incoherent feedforward loop, iFFLs)实现。研究人员利用transcription-activator-like effectors (TALEs)构建了iFFLs稳定的启动子(iFFLs-stabilized Promoters)。结果表明,即使基因的拷贝数由于基因组突变或者培养基条件改变发生了变化,这些iFFLs稳定的启动子控制的目的基因在不同的基因组位点或者质粒上仍能实现接近相同的表达水平。研究人员最后将这些稳定的工程化启动子应用到了涉及三个基因的Deoxychromoviridans代谢通路中。结果表明,由于iFFLs稳定的启动子的作用,将工程化的代谢通路从质粒上转移到基因组上时可以实现相同的表达水平,并且转移的过程无需经过任何调谐。
作者:孟凡康
编辑:孙智
全文约4000字,阅读时间约为8分钟
工程化的基因线路或者调控网络在细胞机器中实现稳定的表达或者输出往往困难很大,因为生长条件的改变、不同的生长时期、基因表达的差异、代谢负担或者环境压力均能影响目的基因的表达水平。基因表达水平同样也会受到拷贝数(Copy Number)的影响。不同的复制原点都有其特殊的自我复制起始机制,这就意味着不同的质粒拷贝数会产生差异。那么将要表达的基因整合到基因组上是否可以解决这个问题?答案是否定的,因为离基因组的复制原点的远近也会影响基因的表达水平。快速分裂的细菌会同时进行多份基因组的复制,这会导致基因组的部分区域(如接近复制原点的区域)在同一个细胞中会存在多种拷贝,所以靠近基因组复制原点的相关基因可能会产生富集。研究表明,基因组上不同位点的平均拷贝数差异最高可以到达8倍(取决于细胞分裂的速度)。所以如果可以减少或者消除DNA拷贝数对基因线路的影响,这将提高整个合成系统的鲁棒性,同时当我们需要在不同系统、不同位置间转移基因线路时可以避免反复的调谐。
面对这个难题,Thomas H Segall-Shapiro , Eduardo D Sontag和Christopher A Voigt通过利用系统和控制理论,用一个精妙的方法解决了基因表达水平受质粒拷贝数影响的难题,相关的工作发表在《Nature Biotechnology》。
实现高鲁棒性基因表达的方法主要有两种,第一种是改造质粒的复制原点使质粒本身的拷贝数保持稳定;第二种方案是调谐基因表达的调控模块,包括启动子的强度、核糖体结合位点(RBS)的强度、RNA和蛋白质的降解速率。尽管这两种方法可以在一定程度上提高基因线路或者网络的鲁棒性,但是这两种方案相对来说工程量大,耗时长,需要反复尝试,并且特定的质粒或者基因网络往往需要特定的调谐方案。同时,当我们把调谐好的基因线路转移到另一种质粒或者基因组上时,我们几乎肯定需要另一轮的调谐过程来克服拷贝数变化所带来的问题。
组成性启动子产生的基因表达的整体水平大致能够反映基因在细胞的拷贝数情况。我们可以让启动子联合额外的元件来解耦基因表达和拷贝数的依赖关系,实现启动子的稳定化(Promoter Stabilization)。启动子的稳定化需要引入新的调控机制:此调控机制需要响应拷贝数的变化,并且根据变化相应的调控启动子的强度。这一点可以通过Autoregulatory feedback、Integral feedback或者Incoherent feedforward loops(iFFLs)实现。比较这三种方案时,研究人员有两点考虑:1.设计的可行性;2.实现完美适应的能力(也就是说,任何拷贝数下都倾向于实现目的基因的恒定表达水平)。尽管Autoregulatory feedback在实现目标上很直接,但是如果没有无穷大的协同抑制(infinitely cooperative repression),这种方案就不能实现完美的适应,并且这种方案有可能产生震荡。相反的,Integral feedback能够实现完美的适应,但是在具体实现上过于复杂。
从左到右依次是:Autoregulatory feedback、Incoherent feedforward loops(iFFLs)和Integral feedback拓扑结构图。概念图制作:孙智。
科研人员最终选择了iFFL方案,因为这种方案简单,理论上可以实现完美的适应,同时其功能在多种实验中都得到了验证。Feedforward loops在自然的转录网络中普遍存在,并且已经应用于大量的工程化系统中。之前,Benenson et al.曾利用转录和转录后iFFLs部分解耦了基因表达水平和转化进哺乳细胞的DNA量的关系。相似的设计也表明iFFLs可以减少由生长差异导致的基因表达水平的变化。
在发表在《Nature Biotechnology》的这篇文章里,Segall-Shapiro et al.报道了一组利用iFFLs拓扑结构实现了稳定化的启动子。无论基因的拷贝数如何变化,这些启动子能够保持目标基因几乎恒定的表达水平。
Segall-Shapiro et al.认为建立完美的iFFLs稳定的启动子系统需要两种条件。首先,抑制蛋白的动态范围(Dynamic Range)必须很广。在这种情况下,目的基因的表达水平将会和拷贝数(c)成为正比例关系,而和抑制蛋白(R)的水平成反比例关系,所以目的基因的表达水平G=c/R^n,其中n是抑制蛋白结合相应启动子的协同程度(Degree of cooperative)。如果抑制蛋白的表达受到组成型启动子调控,所以R将会和拷贝数c成为正比例关系,则G∝c^(1-n)。所以,也就是第二点,当n=1(抑制蛋白处于非协同性效应)时,G∝1,也就是说目的基因的表达水平将不再依赖于拷贝数。
(a)本实验中的iFFLs拓扑结构:拷贝数同时影响抑制蛋白和目的基因的表达;抑制蛋白消除拷贝数对目的基因表达的影响;(b)当n= 0.5, 0.75, 1,1.25 和1.5时,目的基因和抑制蛋白的相互关系。(c)当n= 0.5, 0.75, 1,1.25 和1.5时,目的基因表达水平和拷贝数的相关关系。
在这篇文章中使用的TALE抑制蛋白则满足了这两种条件。TALE蛋白通过设计能够以结合单个DNA操纵子的方式抑制相应的启动子,同时具有较宽的动态范围(能实现~100倍的抑制效果)。重要的是,TALE蛋白作为单体可以以非协同的方式在大肠杆菌中发挥作用。
利用iFFLs拓扑结构,作者通过设计TALE抑制蛋白使其结合到目标基因的启动子区域。接下来,组成性表达的启动子序列被克隆到目的基因启动子的上游区域。由于拷贝数的改变能够同时影响目的基因和抑制蛋白的表达水平,所以iFFLs拓扑结构可以用来稳定输出信号的表达水平。例如,如果拷贝数增加,那么抑制蛋白的表达水平也会增加,这样一来,增加的抑制蛋白可以用来下调目的基因的表达水平。
为了验证iFFLs设计的可行性,作者以GFP为对象检验了设计的效果。他们将普通的启动子(Not Stabilized)和iFFLs稳定的启动子放在拷贝数从1-100不等的质粒上,比较GFP荧光的变化情况。
实验中用的启动子设计。Core:最小启动子的组成组分;Constitutive(Insulated):组成性启动子,用于实验中常规表达目的基因,受拷贝数的影响。同时加入了绝缘子元件,用于绝缘其他序列的影响;Stabilized:iFFLs稳定的启动子,包括启动子、靶向启动子序列的TALE蛋白,和绝缘子元件。
结果表明对照组启动子调控的GFP蛋白的表达水平和拷贝数成正比例关系,随着拷贝数改变而改变。当GFP基因位于基因组上时,表达水平也会由于离基因组ORI的远近而发生变化。然而,当GFP的表达由iFFLs稳定的启动子调控时,无论是在不同拷贝数的质粒上还是不同的基因组整合位点,GFP的表达基本都是恒定的。同时研究还有额外的收获,iFFLs稳定的启动子不仅仅能够克服拷贝数变化带来的干扰,它也能使得GFP的表达水平在不同的培养条件、或者宿主存在影响全局RNA稳定性的基因突变时维持恒定。
相比于对照组未稳定化的启动子,iFFLs稳定化的启动子在(a)质粒拷贝数不同,(b)质粒种类不同,(c)TALE抑制的启动子不同,(d)目的基因不同,(e)基因组插入位点不同时均能保证目的基因恒定的表达水平。
接下来,作者通过将三个基因组成的代谢通路(Prodeoxyviolacein)从质粒上转移到到基因组上,证明了iFFLs稳定的启动子也可以用来维持多个基因的稳定表达。重要的是,结果表明在没有任何调谐的情况下,无论是在质粒还是基因组上,代谢产物的产量都维持在了稳定的水平。
在没有任何调谐的情况下,无论是在质粒还是基因组上,代谢产物Prodeoxyviolacein的产量都维持在了稳定的水平。
由于这种结构的良好结果,iFFLs稳定的启动子可以用来克服一系列影响抑制蛋白和目的基因表达速率的干扰。例如,如果游离的核糖体数量的下降影响了目的基因的翻译速率,那么TALE蛋白在翻译速率上同等水平的下降将减少其本身的抑制效果,进而提高目的基因的转录速率。这样一来,目的基因在翻译速率上的影响就可以被转录速率的提升抵消掉了。
当然这种设计也存在着一定的限制。iFFLs的一个限制是它们不能克服类似于Ribosomal traffic jams,anti-sense RNA inhibition或者enzymatic mRNA and protein degradation的干扰,因为这些干扰以不对称(asymmetrical)的方式作用于TALE抑制蛋白和目的基因。在工程化基因线路和网络变愈加复杂时,这种不对称效应有可能成为一个愈加复杂、繁琐的问题。
iFFLs的另一个限制是回溯活性(Retroactivity)。具体来说,当基因线路或者网络中存在多个iFFLs稳定的启动子时,多个抑制蛋白结合位点将会使可获得的TALE相互分开,也就是说作用于同一位点的TALE蛋白的浓度降低。这一点将会限制我们可以在同一线路或者网络中所能使用的iFFLs稳定的启动子数量。
实现基因在不同环境下的恒定表达是合成生物学领域一个长期存在的挑战。而iFFLs稳定的启动子可以用来解决此难题。这使得我们在一定程度上,可以在不同的拷贝数或者不同的培养条件和压力下维持目的基因表达水平的恒定。加入iFFLs拓扑结构让基因线路或者网络的可移植性成为现实,不仅仅是在质粒或者基因组上,同时也有可能在不同的物种间实现。
参考文献:
1. Segall-Shapiro, Thomas H., Eduardo D. Sontag, and Christopher A. Voigt. "Engineered promoters enable constant gene expression at any copy number in bacteria." Nature biotechnology (2018).
2. Tomazou, Marios, and Guy-Bart Stan. "Portable gene expression guaranteed." Nature Biotechnology 36.4 (2018): 313.